سفارش تبلیغ
صبا ویژن

ابزار DragGAN رقیب جدی Warp فتوشاپ

تحقیقات جدید هوش مصنوعی با توسعه برنامه DragGAN به شما این امکان را می‌دهد روی عکس‌ها کلیک کرده و بکشید تا بتوانید در چند ثانیه آن‌ها را دستکاری کنید این ابزار DragGAN مانند ابزار Warp فتوشاپ عمل می‌کند اما بسیار قدرتمندتر. حتی می‌توانید تصاویر را طوری بچرخانید که انگار سه بعدی هستند. کافی است خودتان ویدئوها را تماشا کنید تا به توانایی حیرت انگیز ابزار Drag GAN در خلق تصاویر واقع ‌گرایانه با استفاده از هوش مصنوعی پی ببرید. دفعه بعد اگر تصویری کاملا طبیعی از یک شیر در آغوش یک کفتار را دیدید، دیگر نباید به چشم‌هایتان شک کنید!
ابزار DragGAN چیست؟
ایجاد محتوای بصری که متناسب با نیازهای کاربر باشد. اغلب مستلزم کنترل دقیق و منعطف بر ویژگی‌هایی مانند: حالت، شکل، بیان، و چیدمان اشیا تولید شده است. روش‌های سنتی برای کنترل شبکه‌های متخاصم مولد (GAN)، به داده‌های دستی یا مدل‌های سه بعدی قبلی متکی هستند. با این حال، این رویکردها اغلب فاقد دقت، انعطاف پذیری و عمومیت هستند. در پاسخ به این کاستی‌ها، موسسه Max Planck DragGAN ابزار DragGAN را معرفی می‌کند، رویکرد جدیدی که به کاربران اجازه می‌دهد تا به صورت تعاملی هر نقطه در یک تصویر را به مکان‌های مورد نظر بکشند.
ابزار DraGAN شامل چند جز است؟
DragGAN شامل دو جز اصلی است: نظارت بر حرکت و رویکرد جدید ردیابی نقطه‌ای. نظارت حرکت امکان حرکت توسط کاربر را در نقاط دسته در تصویر به سمت موقعیت‌های هدف فراهم می‌کند. رویکرد ردیابی نقطه‌ای از ویژگی‌های متمایز ژنراتور استفاده می‌کند تا مکان‌ها را در حین جابجایی ردیابی کند. در نتیجه، کاربران می‌توانند تصاویر را با دقت تغییر شکل دهند و بر ویژگی‌هایی مانند: حالت، شکل، بیان و چیدمان در دسته‌های مختلف مانند: حیوانات، ماشین‌ها، انسان‌ها و مناظر تاثیر بگذارند.
نحوه کار با ابزار DragGAN
برای دستکاری تصاویر با استفاده از ابزار DragGAN کافیست بر روی نقاط دلخواه تصویر کلیک کرده و آن را بکشید تا تغییرات توسط مدل هوش مصنوعی اعمال شود. در واقع این مدل هوش مصنوعی، تغییرات کاملا مرتبطی بر روی تصاویر اعمال می‌کند تا یک تصویر جدید اما مرتبط با تصویر اصلی خلق شود. این ابزار جدید نه تنها می‌تواند اندازه یک خودرو را دستکاری کند یا لبخند را بر روی چهره  موجود در عکس‌ها بیاورد، بلکه حتی از عهده تغییر جهت و چرخش عناصر موجود در تصاویر هم بر می‌آید. البته برای این کار باید تصویر یک مدل سه بعدی باشد.
محققان این مدل که DragGAN نام دارد توضیح می‌دهند: «رویکرد ما می‌تواند محتواهای غیر قابل دسترس مانند دندان‌های داخل دهان یک  ادامه مطلب...